Spatial-Omni: Comprensión de audio espacial en LLM multimodales con FOA
Descubre Spatial-Omni, método ligero que integra audio espacial FOA en LLM multimodales, mejorando localización y razonamiento espacial. Supera a modelos existentes.
Descubre Spatial-Omni, método ligero que integra audio espacial FOA en LLM multimodales, mejorando localización y razonamiento espacial. Supera a modelos existentes.
Nuevo benchmark SpurAudio revela que modelos de audio con pocos ejemplos son sensibles a correlaciones espurias. Conoce las implicaciones para IA.